home *** CD-ROM | disk | FTP | other *** search
/ InfoMagic Standards 1994 January / InfoMagic Standards - January 1994.iso / ccitt / 1992 / t / t416_1.asc < prev    next >
Text File  |  1991-12-31  |  43KB  |  1,135 lines

  1.  
  2. Recommendation T.416
  3.  
  4.  
  5.  
  6.              OPEN DOCUMENT ARCHITECTURE (ODA) AND INTERCHANGE FORMAT - 
  7.                           CHARACTER CONTENT ARCHITECTURES1)
  8.  
  9.  
  10.  
  11.                                       CONTENTS
  12.  
  13.  
  14.  
  15. 1      Scope
  16. 2      References
  17. 3      Definitions
  18. 4      General principles
  19.        4.1  Classes
  20.        4.2  Content
  21.        4.3  Presentation attributes
  22.        4.4  Control functions
  23.        4.5  Graphic characters
  24.        4.6  Space characters
  25.        4.7  Coding of content information
  26.        4.8  Internal structure
  27.  
  28. 5      Character positioning
  29.  
  30.        5.1  Basic concepts
  31.        5.2  Positioning of character images within a line box
  32.        5.3  Positioning of line boxes within a basic layout object
  33. 6      Character imaging
  34.        6.1  Emphasis
  35.        6.2  Font selection
  36.        6.3  Subscript and superscript
  37.        6.4  Character combinations
  38. 7      Definition of character presentation attributes
  39.        7.1  Shared presentation attributes
  40.        7.2  Layout presentation attributes
  41.        7.3  Logical presentation attributes
  42.        7.4  Content architecture class attributes
  43.        7.5  Interactions between presentation attributes and layout directives
  44. 8      Character content portion attributes
  45.        8.1  Common coding attributes
  46.        8.2  Other coding attributes
  47. 9      Formal definitions of character content architecture dependent data types
  48.        9.1  Introduction
  49.        9.2  Representation of presentation attributes
  50.        9.3  Representation of coding attributes
  51.        9.4  Representation of non-basic features and non-standard defaults
  52. 10     Graphic characters
  53.  
  54. ───────
  55.   1)   This text is aligned with the final text of the corresponding International Standard     ISO 8613-6.
  56.  
  57.  
  58.  
  59.  
  60.                                                     Fascicle VII.6 - Rec. T.416      1
  61.  
  62.  
  63.  
  64.  
  65. 11     Definition of control functions and the character SPACE
  66.        11.1 Shared control functions
  67.        11.2 Layout control functions
  68.        11.3 Logical control functions
  69.        11.4 Delimiters
  70.        11.5 SP - Space
  71. 12     Content layout process
  72.        12.1 Introduction
  73.        12.2 Content layout process for processable content
  74.        12.3 Content layout process for formatted processable form
  75.        12.4 Content layout process for formatted form
  76. 13     Content imaging process
  77.        13.1 Introduction
  78.        13.2 Content imaging process for formatted form
  79.        13.3 Content imaging process for formatted processable form
  80. 14     Interactions between presentation attributes and control functions
  81. 15     Definition of character content architecture classes
  82.        15.1 Formatted character content architecture class
  83.        15.2 Processable character content architecture class
  84.        15.3 Formatted processable character content architecture class
  85. Annex A - Summary of content architecture classes
  86. Annex B - Character content architecture levels
  87. Annex C - Coded representations of control functions
  88. Annex D - Summary of object identifiers
  89.  
  90.  
  91.  
  92. 1      Scope
  93.  
  94.  
  95. 1.1    The purpose of the T.410 Series is to facilitate the interchange of documents.
  96.  
  97.        In the context of the T.410 Series, documents are considered to be items such as memoranda, letters, invoices, 
  98. forms and reports, which may include pictures and tabular material. The content elements used within the documents may 
  99. include graphic characters, geometric graphic elements and raster graphic elements, all potentially within one document.
  100.  
  101.        Note - The T.410 Series is designed to allow for extensions, including typographical features, colour, spreadsheets 
  102. and additional types of content such as sound.
  103.  
  104. 1.2    The T.410 Series of Recommendations applies to the interchange of documents by means of data communications 
  105. or the exchange of storage media.
  106.  
  107.        The T.410 Series provides for the interchange of documents for either or both of the following purposes:
  108.  
  109.        -    to allow presentation as intended by the originator;
  110.        -    to allow processing such as editing and reformatting.
  111.        The composition of a document in interchange can take several forms:
  112.        -    formatted form, allowing presentation of the document;
  113.        -    processable form, allowing processing of the document;
  114.        -    formatted processable form, allowing both presentation and processing.
  115.  
  116.  
  117.  
  118.  
  119.  
  120. 2           Fascicle VII.6 - Rec. T.416
  121.  
  122.  
  123.        The T.410 Series also provides for the interchange of ODA information structures used for the processing of 
  124. interchanged documents.
  125.  
  126.        Furthermore, the T.410 Series allows for the interchange of documents containing one or more different types of 
  127. content such as character text, images graphics and sound.
  128.  
  129.  
  130. 1.3    This Recommendation:
  131.  
  132.        -    defines character content architectures that can be used in conjunction with the document architecture 
  133.             defined in Recommendation T.412;
  134.  
  135.        -    defines the internal structure of content conforming to these character content architectures;
  136.  
  137.        -    defines those aspects of positioning and imaging applicable to presentation of these character content 
  138.             architectures in a basic layout object;
  139.  
  140.        -    defines the presentation attributes and control functions applicable to these character content architectures;
  141.  
  142.        -    describes a content layout process which, together with the document layout process described in 
  143.             Recommendation T.412, determines the layout of character content in basic layout objects and the 
  144.             dimensions of these basic layout objects.
  145.  
  146.  
  147.  
  148.  
  149. 2      References
  150.  
  151.  
  152.  
  153.        The following Recommendations and Standards contain provisions which, through reference in this text, constitute 
  154. provisions of the T.410 Series of Recommendations. At the time of publication, the editions indicated were valid. All 
  155. Recommendations and Standards are subject to revision, and parties to agreements based on the T.410 Series of 
  156. Recommendations are encouraged to investigate the possibility of applying the most recent editions of the Recommendations 
  157. and Standards listed below. Members of CCITT, ISO and IEC maintain registers of currently valid Recommendations and 
  158. Standards.
  159.  
  160.        -    ISO 2022 (1986): Information processing - ISO 7-bit and 8-bit coded character sets - Code extension 
  161.             techniques.
  162.  
  163.        -    ISO 6429 (1983): Information processing - ISO 7-bit and 8-bit coded character sets - Additional control 
  164.             functions for character imaging devices.
  165.  
  166.        -    ISO 6937 (1983): Information processing - Coded character sets for text communication.
  167.  
  168.        -    Rec. T.50 (1988): International alphabet No. 5.
  169.  
  170.        -    Rec. X.208 (1988): Specification of abstract syntax notation one (ASN.1).
  171.  
  172.        -    Rec. T.61 (1988): Character repertoire and coded character sets for the international Teletex service.
  173.  
  174.        -    ISO 9541-52): Information processing - Font and character information interchange - Part 5: Font attributes 
  175.             and character model.
  176.  
  177.  
  178.  
  179.  
  180.  
  181. ──────
  182.   2)   To be published.
  183.  
  184.  
  185.  
  186.  
  187.  
  188.  
  189.                                                     Fascicle VII.6 - Rec. T.416      3
  190.  
  191.  
  192.  
  193.  
  194. 3      Definitions
  195.  
  196.  
  197.  
  198.        For the purpose of this Recommendation, the definitions given in Recommendation T.411 apply.
  199.  
  200.  
  201.  
  202. 4      General principles
  203.  
  204.  
  205.  
  206. 4.1    Classes
  207.  
  208.        Three classes of character content architecture are distinguished:
  209.  
  210.        -    a character content architecture for formatted content which allows for document content to be presented 
  211.             (e.g. printed or displayed) as intended by the originator. Formatted content can be used in any basic 
  212.             component;
  213.  
  214.        -    a character content architecture for processable content which allows for document content to be processed 
  215.             (e.g. edited or formatted). Processable content can be used in any basic logical component;
  216.  
  217.        -    a character content architecture for formatted processable content which allows for document content to be 
  218.             processed and also to be presented as intended by the originator. Formatted processable content can be 
  219.             used in any basic component.
  220.  
  221. 4.2    Content
  222.  
  223.        The content of a basic component that conforms to a character content architecture is a character string. This 
  224. character string is formed by concatenating the character strings in the content portions of the basic component.
  225.  
  226.        The content character string consists of a combination of graphic characters, control functions and space 
  227. characters.
  228.  
  229. 4.3    Presentation attributes
  230.  
  231.        Presentation attributes are applicable to basic logical and layout components. They contain information that 
  232. specifies the initial conditions relating to the layout, the imaging and the selection of graphic characters of the content of 
  233. these basic components. Some of these conditions can be changed by control functions contained within the content.
  234.  
  235.        Presentation attributes are classified as follows:
  236.  
  237.        -    logical presentation attributes which can be associated with processable and formatted processable 
  238.             character content. These attributes take effect during the content layout process but are ignored during the 
  239.             content imaging process;
  240.  
  241.        -    layout presentation attributes which can be associated with formatted and formatted processable character 
  242.             content. These attributes take effect during the content imaging process. They are generated either by a 
  243.             content layout process or by a process that creates or edits the formatted or formatted processable content;
  244.  
  245.        -    shared presentation attributes which can be associated with all character content architecture classes. 
  246.             These attributes take effect during either or both the content layout and imaging processes.
  247.  
  248.        Note - Presentation attributes can be applied to the content of a basic component in one of three ways. They can 
  249. be specified directly in an object or object class description or they can be specified directly by means of a presentation style 
  250. associated with the object or object class description. Alternatively, they can be indirectly applied to an object or object class 
  251. by means of a default value list (see Recommendation T.412).
  252.  
  253.  
  254.  
  255.  
  256.  
  257.  
  258.  
  259.  
  260. 4           Fascicle VII.6 - Rec. T.416
  261.  
  262.  
  263. 4.4    Control functions
  264.  
  265.        Control functions with zero or more parameters may specify information relating to the layout or imaging of 
  266. subsequent graphic characters. A control function can also be used to extend or replace the set of graphic characters being 
  267. used. The scope of all control functions is limited to the basic component in which they occur.
  268.  
  269.        Classification of control functions is similar to that of presentation attributes:
  270.  
  271.        -    logical control functions which can be used in processable and formatted processable character content. 
  272.             These control functions take effect during the content layout process but are ignored during the content 
  273.             imaging process;
  274.  
  275.        -    layout control functions which can be used in formatted and formatted processable character content. These 
  276.             control functions take effect during the content imaging process. They are generated by the content layout 
  277.             process. Alternatively, they may be inserted by a process (not described in the T.410 Series of 
  278.             Recommendations) that creates of edits the formatted or formatted processable content;
  279.  
  280.        -    shared control functions which can be used in all character content architecture classes.  These control 
  281.             functions take effect during either or both the content layout and imaging processes.
  282.  
  283.        In addition, formatted processable content may contain control functions known as delimiters. These delimiters are 
  284. used to indicate a string of one or more graphic characters and/or control functions that have been inserted as the result of a 
  285. content layout process (see  12). The delimited graphic characters and/or control functions take effect only during the 
  286. content imaging process. The delimiters take effect during the content layout process by deleting them and the enclosed 
  287. character sequence.
  288.  
  289. 4.5    Graphic characters
  290.  
  291.        The set of graphic characters used in the content of a basic component, and their coded representation, are 
  292. specified by presentation attributes and code extension control functions (see  10 and 11.1.17).
  293.  
  294.        Any set or sets of graphic characters may be used in the content of basic components, subject to the restrictions 
  295. associated with the particular content architecture in use and subject to proper designation and invocation in accordance with 
  296. ISO 2022.
  297.  
  298.        Any non-spacing characters included in a graphic character set are not to be used in isolation but only in 
  299. combination with spacing characters.
  300.  
  301. 4.6    Space characters
  302.  
  303.        The character SPACE (SP) is considered both as a logical control function and as a graphic character. As a 
  304. graphic character, it has a graphical representation consisting of the absence of a graphic symbol. As a control function, it 
  305. indicates a potential line break point (see  12.2.1.3.2).
  306.  
  307.        Note - NBSP (No Break SPace) and any fixed-width space characters, such as "digit space", "em space" and "en 
  308. space" are regarded as graphic characters i.e. are not regarded as line break points.
  309.  
  310. 4.7    Coding of content information
  311.  
  312.        The coded representation of the content information within a content portion is in accordance with the rules 
  313. specified in ISO 2022.
  314.  
  315.        Coded representations of control functions are defined in ISO 6429 and are summarized in  Annex C.
  316.  
  317.  
  318.  
  319.  
  320.  
  321.  
  322.                                                     Fascicle VII.6 - Rec. T.416      5
  323.  
  324.  
  325.  
  326.  
  327. 4.8    Internal structure
  328.  
  329. 4.8.1  Formatted content
  330.  
  331.        Formatted content is content for which all the necessary information relating to the layout and imaging of that 
  332. content has been specified. Content in this form is intended to be imaged as specified and is not intended to be revised by 
  333. an editing process or to be reformatted.
  334.  
  335.        The content of a basic component conforming to a formatted character content architecture consists of one or more 
  336. lines of characters. Each pair of successive lines is separated by a hard line terminator. The last (or only) line may or may 
  337. not be terminated by a hard line terminator; the end of the content of a basic component implicitly terminates the last line.
  338.  
  339. 4.8.2  Processable content
  340.  
  341.        Processable content is content which has not been laid out. Content in this form is suitable for revision by an 
  342. editing process.
  343.  
  344.        Note - The editing process is implementation dependent and is not described in the T.410 Series of 
  345. Recommendations.
  346.  
  347.        In order to image content in this form, it is necessary to apply a content layout process  (see  12) to the content 
  348. which converts the processable content into formatted content (see  4.8.1)  or into formatted processable content (see 
  349.  4.8.3).
  350.  
  351.        To assist the processing (i.e. editing or layout processes) of processable content, a number of logical presentation 
  352. attributes and control functions have been defined (see  7 and 11). In addition, the character SPACE is regarded as both a 
  353. graphic character and as a control function that indicates where a line break may occur when the content is laid out.
  354.  
  355.        The content of a basic component conforming to a processable character content architecture consists of one or 
  356. more sequences of characters. Each pair of successive character sequences is separated by a hard line terminator control 
  357. function. The last (or only) character sequence may or may not be terminated by a hard line terminator.
  358.  
  359.        If the hard line terminator is omitted at the end of the content of a basic logical component to which another basic 
  360. logical component is concatenated (see Recommendation T.412), then the last character sequence continues into the content 
  361. of the next basic logical component. In all other cases, the end of the content of the basic logical component implicitly 
  362. terminates the last character sequence.
  363.  
  364.        The division into character sequences represents the internal structure of the processable content of a basic logical 
  365. component. Each character sequence is anonymous, in that no name or identifier is associated with it, and no relationship 
  366. exists among character sequences except that of sequence.
  367.  
  368. 4.8.3  Formatted processable content
  369.  
  370.        Formatted processable content is content that is structured such that it contains both the formatted content and the 
  371. processable content as subsets. It is identical in structure to the processable content, except that it may contain additional 
  372. control functions and graphic characters that have been added as a result of the content layout process. It is identical in 
  373. structure to the formatted content, except that it may contain logical control functions and delimiters.
  374.  
  375.        Thus, formatted processable content can be converted to processable content by deleting (or ignoring) all layout 
  376. control functions, all occurrences of the delimiters and all control functions and characters within those delimiters.
  377.  
  378.  
  379.  
  380.  
  381.  
  382.  
  383.  
  384.  
  385.  
  386.  
  387. 6           Fascicle VII.6 - Rec. T.416
  388.  
  389.  
  390.        Alternatively, formatted processable content can be converted to formatted content by deleting (or ignoring) all 
  391. logical control functions and the delimiters but retaining the control functions and characters within the delimiters.
  392.  
  393.        Note - The conversion of formatted processable content to processable content is a reversible process (providing 
  394. the same layout constraints are applicable to the content layout process) but converting formatted processable content to 
  395. formatted content is irreversible.
  396.  
  397.        The formatted view of a basic component conforming to a formatted processable character content architecture 
  398. consists of one or more lines of characters. Each pair of successive lines is separated by either a hard or soft line terminator. 
  399. The last (or only) line may or may not be terminated by a hard line terminator; the end of the content of a basic layout 
  400. component implicitly terminates the last line.
  401.  
  402.        The processable view of a basic component conforming to a formatted processable character content architecture 
  403. consists of one or more sequences of characters. Each pair of successive character sequences is separated by a hard line 
  404. terminator. The last (or only) character sequence may or may not be terminated by a hard line terminator.
  405.  
  406.        If the hard line terminator is omitted at the end of the content of a basic logical component to which another basic 
  407. logical component is concatenated (see Recommendation T.412), then the last character sequence continues into the content 
  408. of the next basic logical component. In all other cases, the end of the content of the basic logical component implicitly 
  409. terminates the last character sequence.
  410.  
  411.        Soft line terminators are used as separators between lines within a character sequence. The division into character 
  412. sequences represents the internal structure of the content of a basic logical component. Each character sequence is 
  413. anonymous, in that no name or identifier is associated with it, and no relationship exists among character sequences except 
  414. that of sequence.
  415.  
  416.  
  417.  
  418. 5      Character positioning
  419.  
  420.  
  421.  
  422.        This section specifies how characters are to be positioned within a basic layout object. The intention is to aid 
  423. understanding of the presentation attributes and control functions that relate to character positioning.
  424.  
  425.        This section provides for the positioning of any font that is defined in accordance with ISO 9541-5. This section 
  426. also caters for the positioning of characters pertaining to different fonts within the same basic layout object.
  427.  
  428. 5.1    Basic concepts
  429.  
  430. 5.1.1  Character fonts
  431.  
  432.        In the context of this part of ISO 8613, the term graphic character is used in its abstract sense; that is, this term 
  433. refers to a number of a set of graphic symbols used for the representation of information. The term character image is then 
  434. used to refer to the rendition of a graphic character on a presentation medium.
  435.  
  436.        A font is a set of character images, normally with a common design and size. A set of font attributes is associated 
  437. with the font as a whole and a set of character attributes is associated with each individual character. These attributes are 
  438. defined in ISO 9541-5.
  439.  
  440.        The main purpose of the font attributes is for the recipient to identify the font used by the originator and, in case 
  441. the specified font is not available, the font and character attributes serve as a guidance for the recipient to find an 
  442. appropriate substitute font among those available.
  443.  
  444.  
  445.  
  446.  
  447.  
  448.  
  449.  
  450.  
  451.  
  452.  
  453.                                                     Fascicle VII.6 - Rec. T.416      7
  454.  
  455.  
  456.  
  457.  
  458.        Further information concerning the designation and invocation of different fonts within a basic object is given in  6.
  459. 5.1.2  Directions
  460.        In the context of this Recommendation, all directions are expressed as counter-clockwise angles of rotation (in 
  461. degrees) relative to a specified reference direction (an example is given in Figure 1/T.416).
  462.        The character path is the direction of progression of successive character images within a line box (defined in 
  463.  5.1.7) and is expressed as a  direction relative to the horizontal direction of the layout object (see Figure 4/T.416).
  464.        The line progression is the direction of progression of successive line boxes within the basic layout object and is 
  465. expressed as a direction relative to the character path (see Figure 11/T.416).
  466.        The character orientation is the direction of the character baseline (defined in  5.1.3) relative to the character 
  467. path.
  468.        Only one value for the character path, line progression and character orientation may be specified for a basic 
  469. component.
  470.  
  471.  
  472.  
  473.                                    FIGURE 1/T.416
  474.                                           
  475.                                 Example of direction
  476.  
  477.  
  478. 5.1.3  Character image model
  479.        The position point is a reference point associated with a character image (see Figure 2/T.416). It is used for the 
  480. positioning of the character image within a line box. The escapement point is a reference point associated with a character 
  481. image (see Figure 2/T.416). It is used for the positioning of the next character image.
  482.  
  483.  
  484.                                    FIGURE 2/T.416
  485.                                           
  486.                                 Illustration of kerns
  487.  
  488.  
  489.        The character baseline is an imaginary line across a character image, for the purpose of defining the character 
  490. orientation. The character baseline is a horizontal lien with the character image is in its intended viewing orientation (see 
  491. Figure 3/T.416).
  492.  
  493.  
  494.  
  495.  
  496.  
  497.  
  498.  
  499.  
  500.  
  501.  
  502.  
  503.  
  504.  
  505.  
  506.  
  507.  
  508.  
  509.  
  510.  
  511.  
  512.  
  513.  
  514.  
  515.  
  516.  
  517.  
  518.  
  519.  
  520.  
  521. 8           Fascicle VII.6 - Rec. T.416
  522.  
  523.  
  524.  
  525.  
  526.                                    FIGURE 3/T.416
  527.                                           
  528.                   Reference points for character image positioning
  529.  
  530.  
  531.        A position point and escapement point must be defined for each character orientation which is intended to be used 
  532. (see Figure 3/T.416); i.e., "writing modes" corresponding to the required character orientation must be defined in the font 
  533. description, or fall-backs must be defined in document application profiles.
  534.  
  535.        A kern is that part of the character image that extends beyond its position and escapement points (see Figure 
  536. 2/T.416).
  537.  
  538. 5.1.4  Character spacing
  539.  
  540.        The concept of character spacing is only applicable when a constant spacing font is selected. It is used (in 
  541. conjunction with the inter-character space) to determine the distance between character images within a line box as defined 
  542. in  5.2.1.
  543.        The character spacing is equal to the distance between the position points of successive character images when 
  544. the inter-character space is zero.
  545.        The character spacing is independent of the distance between the position point and escapement point of character 
  546. images.
  547. 5.1.5  Active position
  548.        The active position is an abstraction of an imaging device concept such as a cursor. This concept is used in the 
  549. definitions of control functions (see  11) where a sequential method of processing a character string is assumed.
  550.        The active position indicates the point, within the positioning area of a basic layout object, at which the action 
  551. specified by the next character (graphic character or control function) is to be effected.
  552.        If the next character is a graphic character, its character image is positioned with the position point at the active 
  553. position and the active position is advanced in the direction of the character path by the amount of spacing defined in 
  554.  5.2.1. If the next character is a control function, this may cause the active position to move to another point within the 
  555. positioning area.
  556. 5.1.6  Positioning area
  557.        A positioning area is a rectangular area, wholly contained within a basic layout object, within which position points 
  558. and escapement points are to be positioned (see Figure 4/T.416). Kerns of character images are permitted to extend beyond 
  559. the positioning area but are not permitted to extend beyond the edges of the basic layout object.
  560.  
  561.  
  562.  
  563.  
  564.  
  565.  
  566.  
  567.  
  568.  
  569.  
  570.  
  571.  
  572.  
  573.  
  574.  
  575.  
  576.  
  577.  
  578.  
  579.  
  580.  
  581.  
  582.  
  583.  
  584.  
  585.  
  586.                                                     Fascicle VII.6 - Rec. T.416      9
  587.  
  588.  
  589.  
  590.  
  591.        Two of the edges of the positioning area are referred to as the start edge and end edge (see Figure 4/T.416). The 
  592. start edge and the end edge are defined such that the direction from the start edge to the end edge is in the direction of the 
  593. character path.
  594.  
  595.        The other two edges of the positioning area are referred to as the top edge and bottom edge (see Figure 
  596. 11/T.416). The top edge and the bottom edge are defined such that direction from the top edge to the bottom edge is in the 
  597. direction of line progression.
  598.  
  599.        The start and end edges are indented from the corresponding edges of the basic layout object by a distance 
  600. referred to as the kerning offset (see Figure 4/T.416). The kerning offset specified depends upon the fonts of the characters 
  601. to be positioned in the positioning area. Its value is chosen such that no part of any character image with kerns will extend 
  602. beyond the boundary of the basic layout object when sequences of character images are positioned within it.
  603.  
  604.  
  605.                                    FIGURE 4/T.416
  606.                                           
  607.                      Illustration of character position concepts
  608.  
  609.  
  610. 5.1.7  Line boxes
  611.  
  612.        Within the positioning area, a sequence of character images is positioned within an area, a sequence of character 
  613. image is positioned within an area called a line box (see Figure 11/T.416). Each line box is a rectangular area that extends 
  614. from the start edge to the end edge of the positioning area.
  615.  
  616.        Each line box contains a reference point called the line home position (see Figure 4/T.416).  This point is used for 
  617. positioning the line box within the basic layout object. It also serves as the active position for the first graphic character or 
  618. control function in each line.
  619.  
  620.        Each line box contains an imaginary line called a reference line (see Figure 4/T.416). The reference line passes 
  621. through the line home position in the direction of the character path. It extends from the start edge to the end edge within 
  622. the line box and is used for the alignment of character images.
  623.  
  624.        The length of the line box is equal to the distance between the start and end edges. The width (or height) of a line 
  625. box is equal to the sum of the line box forward extent and the line box backward extent (see Figure 4/T.416). The line box 
  626. backward extent is the distance between the reference line and the edge of the lien box in the direction opposite to the 
  627. direction of line progression. The line box forward extent is the distance between the reference line and the edge of the line 
  628. box in the direction of line progression.
  629.  
  630.  
  631.  
  632.  
  633.  
  634.  
  635.  
  636.  
  637.  
  638.  
  639.  
  640.  
  641.  
  642.  
  643.  
  644.  
  645.  
  646.  
  647.  
  648.  
  649.  
  650.  
  651.  
  652.  
  653.  
  654.  
  655.  
  656.  
  657. 10           Fascicle VII.6 - Rec. T.416
  658.  
  659.  
  660.        The values of the forward and backward extents depend on the maximum extents (measured perpendicular to the 
  661. reference line) of the character fonts used in the line box. Determination of the forward and backward extents take into 
  662. account any displacements of character images perpendicu- lar to the character path, e.g. for subscripts, superscripts and 
  663. parallel annotation.
  664.  
  665.        Note - As an example, for a Latin font with character path 0 degrees, line progression 270 degrees and when a 
  666. single font is used in the line box, then the forward and backward extents are equal to the maximum right and maximum left 
  667. extents for that font as defined in ISO 9541-5.
  668.  
  669.  
  670. 5.2    Positioning of character images within a line box
  671.  
  672.  
  673.        Successive character images are positioned within a line box in the direction of the character path.
  674.  
  675.        The position points of the character images are lined on the reference line unless the characters are imaged as 
  676.  
  677. subscripts, superscripts or parallel annotation.
  678.  
  679.        There are several factors which affect the positioning of character images along the reference line:
  680.  
  681.        -    spacing between characters;
  682.  
  683.        -    alignment;
  684.  
  685.        -    tabulation;
  686.  
  687.        -    character ordering;
  688.  
  689.        -    parallel annotation;
  690.  
  691.        -    subscript/superscript;
  692.  
  693.        -    pairwise kerning;
  694.  
  695.        -    first line offset;
  696.  
  697.        -    itemization.
  698.  
  699. 5.2.1  Spacing between characters
  700.  
  701.        The inter-character space is an additional amount of spacing between the position points of successive character 
  702. images, in the direction of the character path (see  5.1.4). A negative value indicates a reduction in the spacing between 
  703. successive character images.
  704.  
  705.        The distance between the position points of successive character images may be constant or variable depending 
  706.  
  707. upon the font as follows:
  708.  
  709.        -    For fonts with constant spacing, the distance between the position points of successive character images is 
  710.             independent of the characters and is the sum of the character spacing (as specified by presentation 
  711.             attributes and control functions) and the inter-character space (see Figure 5/T.416).
  712.        -    For fonts with variable spacing, the distance between the position points of successive character images is 
  713.             dependent upon the character i.e. normally the distance between the position point and the escapement 
  714.             point of a character, and is the sum of the net escapement of the character (as specified by the font) and 
  715.             the inter-character space (see Figure 6/T.416).
  716.  
  717.  
  718.  
  719.  
  720.  
  721.  
  722.  
  723.  
  724.  
  725.                                                     Fascicle VII.6 - Rec. T.416      11
  726.  
  727.  
  728.  
  729.  
  730.  
  731.                                    FIGURE 5/T.416
  732.                                           
  733.                          Spacing for a constant spacing font
  734.  
  735.  
  736.                                    FIGURE 6/T.416
  737.                                           
  738.                          Spacing for a variable spacing font
  739.  
  740.  
  741.        The space width, i.e. the width of the SP (space) character image, is determined as follows:
  742.        -    for any SP that follows a soft line terminator and precedes the first graphic character of a line, or precedes 
  743.             a line terminator and follows the last graphic character of a line, the width is equal to zero;
  744.        -    in a constant spacing font, the default width equals the character spacing;
  745.        -    in a variable spacing font, the width is implicitly defined by the font;
  746.        -    for all fonts, the width may be specified by a control function.
  747.  
  748. 5.2.2  Alignment
  749.  
  750.        The character images are positioned within a line box in accordance with the alignment attribute as follows:
  751.        -    start-aligned: the position point of the first character image is placed at the line home position;
  752.        -    end-aligned: the escapement point of the last character image is placed at the end edge of the positioning 
  753.             area;
  754.        -    centred: the distance from the line home position to the position point of the first character image is 
  755.             approximately equal to the distance from the escapement point of the last character image to the end edge 
  756.             of the positioning area;
  757.        -    justified: the position point of the first character image is placed at the line home position and the 
  758.             escapement point of the last character image is coincident with the end edge of the positioning area by 
  759.             appropriately setting the space width and/or the inter- character space.
  760.  
  761.  
  762.  
  763.  
  764.  
  765.  
  766.  
  767.  
  768.  
  769.  
  770.  
  771.  
  772.  
  773.  
  774.  
  775.  
  776.  
  777.  
  778.  
  779.  
  780.  
  781.  
  782.  
  783.  
  784.  
  785.  
  786.  
  787.  
  788.  
  789.  
  790.  
  791.  
  792.  
  793. 12           Fascicle VII.6 - Rec. T.416
  794.  
  795.  
  796. 5.2.3  Tabulation
  797.  
  798.        The position of character images along a reference line can be controlled by means of a set of tabulation stops. 
  799. Each tabulation stop specifies a point along a reference line relative to the start edge the positioning area.
  800.        A string of character images can be placed at a tabulation stop by means of a control function embedded in the 
  801. text. The string may be start-aligned, end-aligned, centred or aligned around one or more specified characters within that 
  802. string as follows (see Figure 7/T.416).
  803.        -    start-aligned: the position point of the first character image of the string is placed at the tabulation stop;
  804.        -    end-aligned: the escapement point of the last character image of the string is placed at the tabulation stop;
  805.        -    centred: the string is placed such that the position point of the first character image and the escapement 
  806.             point of the last character image of the string are approximately equidistant from the tabulation stop;
  807.        -    aligned around: the position point of the first character image of the first instance of the specified group of 
  808.             characters in that string is positioned at the tabulation stop.  If the specified group or characters does not 
  809.             appear in the text associated with that tabulation stop, then the alignment defaults to end-aligned as defined 
  810.             above.
  811.  
  812.  
  813.                                    FIGURE 7/T.416
  814.                                           
  815.                                      Tabulation
  816.  
  817.  
  818. 5.2.4  Character ordering
  819.  
  820.        Within the content of a basic object, the interchange order is always the reading order of the language used.
  821.        In the case of certain languages, e.g. Arabic and Hebrew, where the alphanumeric text is read from right to left 
  822. and the numeric text is read from left to right, the interchanged stream must indicate the change in presentation direction at 
  823. the appropriate point(s).
  824.        This is necessary since control functions in character content architectures are defined to operate sequentially 
  825. according to their position in the character stream.
  826.        When a string of characters with reversed presentation direction is embedded in the text with normal presentation 
  827. direction, the image of the last character of the string with reversed presentation direction is positioned adjacent to the image 
  828. of the last character of the preceding string with normal presentation direction (see Figure 8/T.416).
  829.        Note - In Figure 8/T.416 the terms "first" and "last" are used in relation to the interchange order and the terms 
  830. "normal" and "reversed" in relation to the direction of the character path.
  831.  
  832.  
  833.  
  834.  
  835.  
  836.  
  837.  
  838.  
  839.  
  840.  
  841.  
  842.  
  843.  
  844.  
  845.  
  846.  
  847.  
  848.  
  849.  
  850.  
  851.  
  852.  
  853.  
  854.  
  855.  
  856.  
  857.  
  858.  
  859.                                                     Fascicle VII.6 - Rec. T.416      13
  860.  
  861.  
  862.  
  863.  
  864.  
  865.                                    FIGURE 8/T.416
  866.                                           
  867.                                  Character ordering
  868.  
  869.  
  870. 5.2.5  Parallel annotation
  871.  
  872.        Two sequential character strings may be delimited such that the second string is used to indicate the pronunciation 
  873. and interpretation of the first. It is intended to be used in the Japanese language to provide pronunciation and interpretation 
  874. information (Ruby) in the form of Kana character(s) for one or more Kanji characters. This is indicated in the formatted text 
  875. by the Kana character(s) being centered either above or to the right of the Kanji character(s), for character image orientations 
  876. orthogonal and parallel to the character path respectively (see Figure 9/T.416).
  877.  
  878.        Where centring would result in Kana characters being positioned outside the positioning area, then the Kana 
  879. character string is positioned such that it is start-aligned or end-aligned with the edge of the available area.
  880.  
  881. 5.2.6  Subscript/superscript
  882.  
  883.        Subscript rendition allows for the active position to be displaced from the reference line in the direction of line 
  884. progression.
  885.  
  886.        Superscript rendition allows for the active position to be displaced from the reference line in the direction opposite 
  887. to that of line progression.
  888.  
  889.        The combined effect of all subscript/superscript renditions within a line box must be such that the active position is 
  890. returned to the reference line before the occurrence of a hard or soft line terminator.
  891.  
  892.  
  893.  
  894.  
  895.  
  896.  
  897.  
  898.  
  899.  
  900.  
  901.  
  902.  
  903.  
  904.  
  905.  
  906.  
  907.  
  908.  
  909.  
  910.  
  911.  
  912.  
  913.  
  914.  
  915.  
  916.  
  917.  
  918.  
  919.  
  920.  
  921.  
  922.  
  923.  
  924.  
  925.  
  926.  
  927.  
  928.  
  929.  
  930. 14           Fascicle VII.6 - Rec. T.416
  931.  
  932.  
  933.  
  934. Where:
  935.        HPB    Character position backward;
  936.        HPR    Character position relative;
  937.        VPB    Line position backward;
  938.        VPR    Line position relative;
  939.        xx,xw'xw',yy   User specified.
  940.  
  941.        The current reference point moves from "a", "b", "c" and returns to "a".
  942.  
  943.                                    FIGURE 9/T.416
  944.                                           
  945.                          Illustration of parallel annotation
  946.  
  947.  
  948. 5.2.7  Pairwise kerning
  949.  
  950.        Pairwise kerning allows for the moving of the active position from that defined by the preceding character. The 
  951. distance and direction depend both on the character being imaged and the preceding character.
  952.  
  953.        In the case of a constant spacing font, pairwise kerning is ignored.
  954.  
  955.        In the case of a variable spacing font, the actual distance between the escapement point of one character image 
  956. and the position point of the next character image is modified by the kerning information as defined in the character attributes 
  957. of the font.
  958.  
  959. 5.2.8  First line offset
  960.  
  961.        First line offset allows for character imaging of the first line of a basic component to start at a position displaced 
  962. from the line home position.
  963.  
  964.        The offset is either in the direction of the character path (producing first line indentation)  or in the direction 
  965. opposite to the character path (producing overhang) as illustrated in Figure 10/T.416.
  966.  
  967.  
  968.  
  969.  
  970.  
  971.  
  972.  
  973.  
  974.  
  975.  
  976.  
  977.  
  978.  
  979.  
  980.  
  981.  
  982.  
  983.  
  984.  
  985.  
  986.  
  987.  
  988.  
  989.  
  990.  
  991.  
  992.  
  993.  
  994.  
  995.  
  996.  
  997.  
  998.  
  999.                                                     Fascicle VII.6 - Rec. T.416      15
  1000.  
  1001.  
  1002.  
  1003.  
  1004.  
  1005.  
  1006.                                    FIGURE 10/T.416
  1007.                                           
  1008.                   Illustration of itemization and first line offset
  1009.  
  1010.  
  1011. 5.2.9  Itemization
  1012.  
  1013.        Itemization allows for imaging of an item identifier on the first line of a basic component in positions which are not 
  1014. constrained by the line home position and the first line offset (see Figure 10/T.416).
  1015.        An item identifier is a string of characters that precedes and is separated from the remainder of the first line of a 
  1016.  
  1017. basic component.
  1018.  
  1019.        A start offset and an end offset are defined relative to the line home position. These offsets determine the location 
  1020. of the item identifier and the separation between the item identifier and the line home position.
  1021.  
  1022.  
  1023.  
  1024.  
  1025.  
  1026.  
  1027.  
  1028.  
  1029.  
  1030.  
  1031.  
  1032.  
  1033.  
  1034.  
  1035.  
  1036.  
  1037.  
  1038.  
  1039.  
  1040.  
  1041.  
  1042.  
  1043.  
  1044.  
  1045.  
  1046.  
  1047.  
  1048.  
  1049.  
  1050.  
  1051.  
  1052.  
  1053.  
  1054.  
  1055.  
  1056.  
  1057.  
  1058.  
  1059.  
  1060.  
  1061.  
  1062.  
  1063.  
  1064.  
  1065.  
  1066.  
  1067.  
  1068.  
  1069.  
  1070. 16           Fascicle VII.6 - Rec. T.416
  1071.  
  1072.  
  1073.        The item identifier may be positioned on the first line in accordance with the item identifier alignment attribute as 
  1074. follows:
  1075.        -    start-aligned: the position point of the first character image of the item identifier is place at the start offset;
  1076.        -    end-aligned: the escapement point of the last character image of the item identifier is placed at the end 
  1077.             offset.
  1078. 5.3    Positioning of line boxes within a basic layout object
  1079.        For positioning of line boxes in a basic layout object, the area of that object is independent of any adjoining areas. 
  1080. No part of the image is permitted to extend beyond the boundaries of the basic layout object.
  1081.        The initial point is the point relative to which all line boxes are positioned within the basic layout object (see 
  1082.  7.2.2 and Figure 11/T.416).
  1083.        The line home position of the first line box is at the initial point of the basic layout object. Subsequent line home 
  1084. positions are located on a line through the initial point in the direction of line progression.
  1085.        The distance between the line home positions of two successive line boxes is determined as follows:
  1086.        -    when proportional line spacing is to be performed, the distance between the reference lines of two 
  1087.             successive line boxes is evaluated by an implementation dependent algorithm not defined in this 
  1088.             Recommendation;
  1089.        -    when proportional line spacing is not to be performed, the distance between the reference lines of two 
  1090.             successive line boxes is equal to the current line spacing as specified by presentation attributes and control 
  1091.             functions.
  1092.  
  1093.  
  1094.                                    FIGURE 11/T.416
  1095.                                           
  1096.                     Illustration of line box positioning concepts
  1097.  
  1098.  
  1099. 6      Character imaging
  1100.  
  1101.        Four groups of specifications may apply to the imaging of graphic character elements in a basic object, namely 
  1102. those relating to:
  1103.        -    emphasis;
  1104.        -    font selection;
  1105.        -    subscript and superscript;
  1106.        -    character combinations.
  1107.        These groups of specifications are defined below.
  1108.        Note 1 - Emphasis (by "weight", "posture" etc.) and subscript/superscript rendition may be achieved by font 
  1109. selection.
  1110.  
  1111.  
  1112.  
  1113.  
  1114.  
  1115.  
  1116.  
  1117.  
  1118.  
  1119.  
  1120.  
  1121.  
  1122.  
  1123.  
  1124.  
  1125.  
  1126.  
  1127.  
  1128.  
  1129.  
  1130.  
  1131.                                                     Fascicle VII.6 - Rec. T.416      17
  1132.  
  1133.  
  1134.  
  1135.